查看原文
其他

精彩回顾 | 斐波那契(FiboAI)CEO国德峰作为嘉宾出席“2022数据要素安全流通论坛—联邦学习专场(二)”并发表主题演讲

华东数据君 华东江苏数据交易中心 2024-01-09

6月17日,由《数据要素安全流通白皮书》编委会主办的《2022数据要素安全流通论坛—联邦学习专场(二)》在线上举行,论坛以“推动创新 交互未来”为主题,探讨数据价值安全、高效流转之道。

本次论坛受邀出席嘉宾有华东江苏大数据交易中心总经理汤寒林、斐波那契(FiboAI)CEO国德峰、融安数科创始人&CTO刘伟、洞见科技解决方案总监薛婧、九四智能运营总监温聪颖。


精彩回顾

斐波那契(FiboAI)CEO国德峰作为嘉宾出席此次论坛,并围绕“联邦学习重塑数据生态”主题进行分享。

01

斐波那契(Fibo)

斐波那契(Fibo),成立于2020年11月,致力于决策科技AI领域,以数字决策平台(DDP)为核心,通过大数据、人工智能、联邦学习等先进技术助力企业进行数字化升级和转型,实现人工智能快速规模化转型落地,发掘数据背后的规律,实现智能决策,全方位提升决策能力。

02

联邦学习背景

国德峰表示,随着互联网和科技的发展,数据呈现爆炸式指数级增长,数字化已经成为构建现代社会的基础力量,并推动我们走向深度变革的时代。根据IDC发布的《数据时代2025》报告显示,全球每年产生的数据从2018年的33ZB增长到175ZB,相当于每天产生491EB的数据,如果把175ZB全部存在DVD光盘中,那么DVD叠加起来的高度将是地球和月球距离的23倍(月地最近距离约39.3万公里),或者绕地球222圈(一圈约为四万公里),但这些数据散落在各处,比如我们在实际业务中用到的社交数据、广告营销数据、运营商数据、电商数据、消费数据等分布在各个机构和企业中,我们总是希望这些数据可以整合并打通,使数据覆盖全面,但现实往往不是这样,而是数据孤岛现象严重。

除此之外,每家企业和机构掌握的数据有限,如果想做各种模型或决策需要跨机构合作,但传统的跨机构数据合作充满风险、效果难以得到保证,因为用户隐私受到保护、监管合规趋严、模型效果难提升。面对数据合作困境,有两种传统解决方案,但无法解决根本问题,一种是直接传递脱敏数据,对于一些合规要求较低的企业,降数据进行简单脱敏处理后传给使用方,在使用方侧建立模型;另外一种是各自建模,子模型融合,数据不出各自环境,建模人员携带Y样本,分别在两个企业驻场进行模型训练,再将子模型结果进行融合,数据最终评分。

传统的方法不能解决数据合作困境,那有什么创新的模式呢?国德峰表示,联邦学习是“数据孤岛”问题的优秀解决方案,允许从跨数据所有者分布的数据中构建聚合模型,提供了跨企业的数据使用和模型开发的蓝图,并适用于B2B和B2C等业务,可广泛应用于广告营销等各种领域,重塑数据生态。

首先,联邦学习希望各个企业自有的数据不出本地,实现数据“可用不可见”,而联邦系统可以通过加密机制下的参数交换的方式,在不违法数据隐私保护法规的情况下,建立一个虚拟的共有模型。这个虚拟模型就好像大家把数据聚合在一起建立的最优模型一样。

此外,联邦学习重塑数据生态非常重要的一个关键点就是安全的数据传输,使不同的机构无法得到对方的数据。我们知道A,B共有id Xc:{1,2,3},但是要使得使B不知道A有4,A不知道B有5,这样每个机构的数据才是安全的。

所以,联邦学习的主要理念,就是要做到在用户不对外共享数据的前提下,完成传统人工智能技术无法实现的多机构联合训练模型系统,重塑数据生态。具体表现为1)各方数据都保留在本地,不泄露隐私也不违反法规;2)多个参与者联合数据建立虚拟的共有模型,并且共同获益的体系;3)联邦学习的建模效果和将整个数据集放在一处建模的效果相同,或相差不大;4)联邦学习通过加密手段交换参与各方的梯度,而非用户数据本身,且根据梯度无法反推原始数据;5)参与联邦学习的双方可根据样本对齐找出同样的用户,将这部分用户的不同特征作为输入、迭代训练模型和交 换参数。在此过程中,双方不能反推对方拥有而自己没有的用户/特征;6)参与联邦学习的各方可以在不共享数据的前提下,利用双方的数据优势实现各自的模型增长。

03

联邦学习应用场景案例

国德峰还分享了联邦学习重塑数据生态的应用场景案例。联邦学习适用于B2B和B2C等业务,可广泛应用于各种应用场景,比如互联网+银行、互联网+保险、银行+监管、互联网+零售、智慧城市、智慧安防和智慧制造等。联邦学习使得数据应用的形式发生了变化,不断推进数据变革,重塑数据生态。

首先是联邦建模,在联邦建模上,联邦学习主要解决企业之间的安全联邦建模场景。通过学习、数据加密计算和交互,实现了各机构间数据在隐私数据不出库前提下的联邦建模,为风控、营销领域业务实践提供精准数据驱动能力。

第二是精准获客,以银行为例,基于联邦学习,在银行和第三方进行联合建模,在合规的前提下,提升精准获客能力

第三是基于联邦学习的个人信贷风控模型,金融机构希望提升模型效率,想与企业进行数据层面的合作,但是只有金融机构拥有Y=“逾期表现”,合作企业无法暴露含有隐私的X,传统的数据传统建模方法使得合作企业缺乏Y,无法独立建模,X数据全量传输到金融机构不可行。最好的解决方案就是联邦学习建模方式,让金融机构只有几十维度和合作企业上百维度进行结合,使得联合模型效果超过单边数据建模。

04

联邦学习重塑数据生态

最后,国德峰总结了联邦学习重塑数据生态的发展趋势。1)统一数据标准与技术规范:联邦学习的应用,涵盖多个数据生命周期,包括数据的创建与存储、数据处理、特征提取等,统一数据标准将极大降低系统处理损耗;2)重塑数据生态 构建解决方案:在人工智能的发展和应用实践过程中,联邦学习因其数据隐私保护、跨机构合作等方面的独特优势,有效重塑了数据生态,在未来构建出更全面、更丰富、更可靠、更安全的解决方案;3)促进智能决策蓬勃发展:随着联邦学习的日趋成熟、完善以及应用推广,有效规避隐私安全,促进业务发展与数据应用平衡的同时,也助力各类企业智能决策,促进智能决策蓬勃发展。

01

华东江苏大数据交易中心会员招募火热进行中......

02

线上直播 | 《2022数据要素安全流通论坛——区块链专场(二)》线上主题活动成功举办!

03

精彩回顾 | 洞见科技解决方案总监薛婧作为嘉宾出席“2022数据要素安全流通论坛—联邦学习专场(二)”并发表主题演讲

04

国务院关于加强数字政府建设的指导意见

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存